还没有笔记
选中页面文字后点击「高亮」按钮添加
📜 [原文1]
集合和函数的语言渗透于数学之中。粗略地说,每一个数学对象都是一个集合,而数学中大多数重要的运算最终都是函数,或者可以用函数来表达。我们不会定义什么是集合,而是将集合 $X$ 的概念和成员关系 $x \in X$($x$ 是 $X$ 的一个元素)作为基本(未定义)术语。$x \in X$ 的否定是 $x \notin X$:$x$ 不是 $X$ 的一个元素。通常,一个集合的元素本身就是集合,这强调了在数学中,一切皆是集合。集合通常有两种描述方式:(i) 作为列表 $\left\{x_{1}, \ldots, x_{n}\right\}$,例如 $\{1,2,4,5\}$,或者 (ii) 通过描述其元素来定义,例如上述集合也可以通过以下方式指定:
其中 $\mathbb{Z}$ 表示所有整数的集合。有时(特别是在几何语境中),我们将“$x$ 是 $X$ 的一个点”作为 $x \in X$ 的同义词。
这段话是现代数学的基石,它引入了两个最核心、最基本的概念:集合 (Set) 和 函数 (Function)。
这个等式展示了描述集合的两种方法是等价的。我们来逐项拆解右边的描述法:
推导过程:
本段引入了数学中最基本的概念——集合。它将集合和成员关系($\in$)作为不加定义的初始术语,并阐述了描述集合的两种标准方法:直接列出所有元素的列举法,以及通过定义元素属性的描述法。最后,通过一个例子展示了两种方法的等价性。
本段的目的是为后续所有数学内容的学习搭建最底层的舞台。没有集合,就无法精确地定义数字、函数、几何形状、代数结构等任何数学对象。这部分内容确立了数学论述的共同语言和基本规则,确保了数学的严谨性和一致性。
📜 [原文2]
两个集合 $X$ 和 $Y$ 相等当且仅当它们拥有相同的元素:$X=Y$ 当且仅当,对于所有 $x, x \in X \Longleftrightarrow x \in Y$。我们可以不正式地这样说:一个集合由其元素唯一指定。
这个定义是关于集合相等 (Set Equality) 的,它给出了判断两个集合是否是同一个集合的唯一标准。
这是一个更完整的形式化表达,我们来拆解:
推导:这个定义本身是一个公理,是集合世界的基本法则,所以它不是从其他定理“推导”出来的,而是我们进行一切推导的出发点。
此定义确立了集合相等的黄金标准:两个集合相等,当且仅当它们的元素完全相同。这是集合论的“外延公理”,强调了集合的本质在于其包含的元素,而非其名称或描述形式。
这个定义至关重要,因为它给了我们一个明确的、无歧义的方法来判断我们所处理的数学对象(集合)何时是“同一个”。没有这个定义,数学将充满混乱,例如,我们将无法确定 $\{1,2\}$ 和 $\{2,1\}$ 是否代表同一个数学实体。它是所有关于集合的证明和推理的基础。
📜 [原文3]
一个集合 $X$ 是空的当且仅当,对于所有 $x, x \notin X$。因此 $X$ 没有元素。这在逻辑上意味着 $X$ 由条件“对于所有 $x, x \notin X$”唯一指定:空集只有一个,记作 $\emptyset$。
这个定义引入了一个极其重要但又有些抽象的概念——空集 (Empty Set)。
本段的核心是定义,没有复杂的计算公式,但其逻辑推导值得关注。
空集本身就是最具体的例子。但我们可以通过描述法构造一些看起来不同,但实际上都是空集的集合,以体会其唯一性。
本段定义了空集 $\emptyset$,即不包含任何元素的集合。其关键特性是:根据外延公理,空集是唯一的。任何通过描述法定义的、实际上不可能有元素的集合,都是空集 $\emptyset$。
空集在集合论和整个数学中扮演着类似数字“0”在算术中的角色。它是一个基础构建块,是许多定义和证明的起点或边界情况。例如,在集合运算中,一个集合与空集的交集是空集。在逻辑推理中,“对于空集中的所有元素……”开头的命题(例如“空集中所有的大象都是粉色的”)被认为是“真空真 (vacuously true)”,因为你找不到任何反例。
📜 [原文4]
设 $X, Y$ 是两个集合。如果对于每一个 $x \in X, x \in Y$,则 $X$ 是 $Y$ 的子集或 $X$ 包含于 $Y$,记作 $X \subseteq Y$。
我们也将其记作 $Y \supseteq X$(或 $Y$ 包含 $X$)。
符号 $X \varsubsetneqq Y$ 或 $X \subset Y$ 有时用来表示 $X \subseteq Y$ 但 $X \neq Y$。
(有些人用 $X \subset Y$ 来表示 $X \subseteq Y$,但我们将这些符号区分开来。)
这个定义引入了集合之间的一种基本关系:子集 (Subset)。
本段定义了集合间的子集关系。$X \subseteq Y$ 意味着 $X$ 的所有元素也都是 $Y$ 的元素。同时,它区分了允许相等的子集($\subseteq$)和不允许相等的真子集($\subset$),并明确了本书中将要使用的符号约定。
子集关系是组织和比较集合的基本工具。它建立了集合之间的层次结构,这在数学中无处不在。例如,自然数是整数的子集,整数是有理数的子集,等等。集合相等的定义(定义1.1.1)也可以通过子集关系来重新表述:$X=Y$ 当且仅当 $X \subseteq Y$ 并且 $Y \subseteq X$。这个“双向包含”的证明方法是证明两个集合相等的标准技巧。
📜 [原文5]
(i) $X \subseteq X$ 且 $\emptyset \subseteq X$。$X$ 的子集 $A$ 称为真子集如果 $A \neq X$。
(ii) 根据集合相等的定义,$X=Y \Longleftrightarrow X \subseteq Y$ 且 $Y \subseteq X$。如果 $X \subseteq Y$ 且 $Y \subseteq Z$,则 $X \subseteq Z$;这称为传递性。
(iii) 如果 $x \in X$(因此特别是 $X \neq \emptyset$),则 $\{x\} \subseteq X$。形式为 $\{x\}$ 的 $X$ 的子集称为单元素子集或单例子集。
这段备注总结并强调了子集关系的一些基本且重要的性质。
(i) 两个特殊的子集
(ii) 子集与相等、传递性
(iii) 单元素子集
该备注总结了子集关系的三个核心性质:
(i) 任何集合都是自身的子集,空集是任何集合的子集。
(ii) 集合相等等价于双向包含,且子集关系具有传递性。
(iii) 包含单个元素的集合被称为单元素子集。
这些性质是使用子集关系进行数学推理的基本工具。特别是“双向包含证明相等”和“传递性”,它们是集合相关证明中不可或缺的逻辑步骤。明确这些性质可以使论证过程更加清晰和严谨。
📜 [原文6]
形式为 $X=\left\{x_{1}, \ldots, x_{n}\right\}$ 的集合是有限集。如果对于所有 $i, j$ 且 $1 \leq i, j \leq n$,我们有 $x_{i} \neq x_{j}$,则我们记作 $\#(X)=n$。根据逻辑或约定,$\emptyset$ 是有限的,且 $\#(\emptyset)=0$。反之,如果 $X$ 是一个(有限)集合且 $\#(X)=0$,则 $X=\emptyset$。形式为 $\{x\}$ 的集合恰好有一个元素。特别是,$\{\emptyset\}$ 有一个单元素,即 $\emptyset$,因此 $\{\emptyset\} \neq \emptyset$。同样地,$\#(\{\emptyset,\{\emptyset\}\})=2$。
如果一个集合不是有限的,则它是无限的。(有些人使用 $\#(X)=\infty$ 来表示 $X$ 是无限的,但我宁愿避免使用这个符号,因为符号 $\infty$ 并不是衡量无限集大小的明确方法。)
这个定义引入了有限集 (Finite Set) 和无限集 (Infinite Set) 的概念,并定义了衡量有限集大小的基数 (Cardinality) 符号。
本段定义了有限集和无限集,并引入了表示有限集元素个数的基数符号 #(X)。通过一系列关于空集的例子,澄清了集合、元素和基数之间的关系,并对使用无穷符号 \infty 表达无限集基数的局限性提出了告诫。
区分有限与无限是数学中的一个根本性分界。许多在有限集上显而易见的定理,在无限集上可能不成立,或者需要更复杂的证明。定义基数为后续的组合数学、概率论以及更高级的集合论提供了基础。没有“多少”这个概念,很多数学分支都无法开展。
📜 [原文7]
(i) $\mathbb{N}$ 是自然数集:
(有些人允许 0 是自然数,但这不是本文的约定。)
(ii) $\mathbb{Z}$ 是整数集:
(iii) $\mathbb{Q}$ 是有理数集。一个有理数 $a / b$ 写成整数 $a, b$ 的商,其中 $b \neq 0$,且两个商 $a / b$ 和 $c / d$ 定义相同的有理数 $\Longleftrightarrow a d=b c$。一个有理数有一个“最佳描述”形式 $a / b$,其中 $b>0$ 且 $a, b$ 没有公因子(我们说 $a / b$ 是最简形式)。我们稍后会回到这一点。
(iv) $\mathbb{R}$ 是实数集。集合 $\mathbb{R}$ 不是代数定义的,所以我们在此不讨论它的构造。
(v) $\mathbb{C}$ 是复数集。我们稍后会回到 $\mathbb{C}$ 的性质。
这段话的作用相当于一个“符号速查表”,列举了在数学中广泛使用的几个基本数集,并对它们做了简要说明。这些符号($\mathbb{N}, \mathbb{Z}, \mathbb{Q}, \mathbb{R}, \mathbb{C}$)是数学家之间的“黑话”,必须熟记。它们通常用一种特殊的“黑板粗体 (blackboard bold)”字体书写。
(i) 自然数集 $\mathbb{N}$ (Natural Numbers)
(ii) 整数集 $\mathbb{Z}$ (Integers)
(iii) 有理数集 $\mathbb{Q}$ (Rational Numbers)
(iv) 实数集 $\mathbb{R}$ (Real Numbers)
(v) 复数集 $\mathbb{C}$ (Complex Numbers)
$\mathbb{N} \subset \mathbb{Z} \subset \mathbb{Q} \subset \mathbb{R} \subset \mathbb{C}$
本段定义了五个基本的标准数集符号:$\mathbb{N}$ (自然数), $\mathbb{Z}$ (整数), $\mathbb{Q}$ (有理数), $\mathbb{R}$ (实数), 和 $\mathbb{C}$ (复数)。它简要说明了每个集合的构成和关键性质,并特别强调了不同教材对自然数定义可能存在的差异。
这部分内容是为了“统一语言”。在后续的讨论中,作者会频繁地使用这些符号,而不再每次都解释它们的含义。提前定义好这些符号,可以使行文更简洁,也确保读者和作者在同一个频道上交流。
📜 [原文8]
如果 $X_{1}$ 和 $X_{2}$ 是两个集合,则:
(i) $X_{1}$ 和 $X_{2}$ 的并集是集合
因此 $X_{1} \subseteq\left(X_{1} \cup X_{2}\right)$ 且 $X_{2} \subseteq\left(X_{1} \cup X_{2}\right)$。有限多个集合的并集也类似定义:如果 $X_{1}, \ldots, X_{n}$ 是集合,则
根据这些定义,我们有:对于所有集合 $X_{1}, X_{2}, X_{3}$,
本节开始介绍如何通过已有的集合来创建新的集合。第一种方法是并集 (Union)。
这两行是并集运算的交换律和结合律,它们是集合代数的基本法则,可以从定义直接推出。例如,因为逻辑上的“或”满足交换律(P \lor Q 等价于 Q \lor P),所以集合并集也满足交换律。
本段定义了集合的并集运算 ($\cup$),即创建一个包含所有原始集合中出现过的元素的新集合。并集运算满足交换律和结合律。
并集是构造更复杂的集合的基本操作之一。它在数学的许多领域都有应用,例如:
📜 [原文9]
(ii) $X_{1}$ 和 $X_{2}$ 的交集是:
因此 $\left(X_{1} \cap X_{2}\right) \subseteq X_{1}$ 且 $\left(X_{1} \cap X_{2}\right) \subseteq X_{2}$。同样地
如 (i) 所示,对于所有集合 $X_{1}, X_{2}, X_{3}$,
本节介绍第二种集合基本运算:交集 (Intersection)。
这两行是交集运算的交换律和结合律。它们源于逻辑“与”运算同样满足这些定律。
本段定义了集合的交集运算 ($\cap$),即创建一个只包含所有原始集合共有的元素的新集合。交集运算同样满足交换律和结合律。
交集是另一个基本的集合构造工具,用于筛选和提取共同特征。
📜 [原文10]
(iii) 给定两个集合 $X_{1}$ 和 $X_{2}$,$X_{2}$ 在 $X_{1}$ 中的补集,记作 $X_{1}-X_{2}$,是集合
因此 $X_{2} \cap\left(X_{1}-X_{2}\right)=\emptyset$。如果 $X_{2} \subseteq X_{1}$,则 $X_{2} \cup\left(X_{1}-X_{2}\right)=X_{1}$。例如,$X-X=\emptyset$ 且 $X-\emptyset=X$。
本节介绍第三种集合基本运算:差集 (Set Difference) 或称为相对补集 (Relative Complement)。
本段定义了集合的差集运算 ($X_1-X_2$),即从 $X_1$ 中移除所有也属于 $X_2$ 的元素后得到的新集合。此运算不满足交换律,其结果是第一个集合 $X_1$ 的一个子集。
差集运算提供了“排除”或“细化”的功能,在构建集合和逻辑推理中非常有用。
📜 [原文11]
(i) 注意,对于每个 $j$ 且 $1 \leq j \leq n, X_{j} \subseteq \bigcup_{i=1}^{n} X_{i}$。此外,如果 $Y$ 是一个集合,使得对于每个 $j$ 且 $1 \leq j \leq n, X_{j} \subseteq Y$,则 $\bigcup_{i=1}^{n} X_{i} \subseteq Y$。这大致说明 $\bigcup_{i=1}^{n} X_{i}$ 是包含所有 $X_{j}$ 的最小集合。
(ii) 同样地,对于每个 $j$ 且 $1 \leq j \leq n, \bigcap_{i=1}^{n} X_{i} \subseteq X_{j}$。此外,如果 $Y$ 是一个集合,使得对于每个 $j$ 且 $1 \leq j \leq n, Y \subseteq X_{j}$,则 $Y \subseteq \bigcap_{i=1}^{n} X_{i}$。这大致说明 $\bigcap_{i=1}^{n} X_{i}$ 是包含于所有 $X_{j}$ 的最大集合。
(iii) 检查以下公式是定义的练习:
(iv) 根据逻辑(德摩根定律),$Y-\left(X_{1} \cap X_{2}\right)=\left(Y-X_{1}\right) \cup\left(Y-X_{2}\right)$ 且 $Y-\left(X_{1} \cup X_{2}\right)= \left(Y-X_{1}\right) \cap\left(Y-X_{2}\right)$。(例如,如果 $x \in Y, x \notin X_{1} \cap X_{2}$,那么 $x \notin X_{1}$ 或 $x \notin X_{2}$,反之亦然。)
这个备注总结了并集和交集的“最小/最大”性质,并引入了分配律和德摩根定律。
(i) 并集是最小的“超集”
(ii) 交集是最大的“子集”
(iii) 分配律 (Distributive Laws)
(iv) 德摩根定律 (De Morgan's Laws)
这些是分配律的公式。证明它们通常使用“双向包含”法,并依赖于逻辑命题的分配律。例如,证明第一条 A = B:
本备注阐述了集合运算的一些高级定律。并集和交集分别是包含所有成员的“最小”超集和被所有成员包含的“最大”子集。分配律揭示了并集与交集混合运算的规则,而德摩根定律则给出了补集如何与并集、交集相互作用的深刻关系。
这些定律是进行集合运算和逻辑推演的“代数法则”。它们使得我们可以像处理代数表达式一样,对复杂的集合表达式进行化简、变形和证明,是集合代数和布尔代数的核心内容。
左边是 (X1 U X2) 的区域,右边是 Y 的区域,交集是它们重叠的部分(深灰色)。这等于 X1 ∩ Y (左月牙+中间) 和 X2 ∩ Y (右月牙+中间) 的并集。
从大框 Y 中挖掉 X1 和 X2 的交集(中间部分),剩下的区域等于 Y-X1(Y中 X1以外的部分)和 Y-X2(Y中 X2以外的部分)的并集。
📜 [原文12]
给定 $X$ 和 $Y$,我们定义 $X \times Y$,即 $X$ 和 $Y$ 的笛卡尔积,为有序对 $(x, y)$ 的集合,其中 $x \in X$ 且 $y \in Y$。此处 $x$ 是有序对 $(x, y)$ 的第一分量或第一坐标,而 $y$ 是第二分量(或坐标)。
如果 $X=Y$,我们用 $X^{2}$ 缩写 $X \times X$。同样地,如果我们有 $n$ 个集合 $X_{1}, \ldots, X_{n}$,那么 $X_{1} \times \cdots \times X_{n}$ 是有序 $n$ 元组 $\left(x_{1}, \ldots, x_{n}\right)$ 的集合,其中每个 $i$ 都有 $x_{i} \in X_{i}$,$\left(x_{1}, \ldots, x_{n}\right)$ 的第 $i$ 个分量(或坐标)是 $x_{i}$,我们再次用 $X^{n}$ 缩写 $X \times \cdots \times X$($n$ 次)。
这个定义引入了一种全新的、非常强大的构造新集合的方法:笛卡尔积 (Cartesian Product)。它构造出的元素类型——有序对——与我们之前见过的都不同。
本段定义了笛卡尔积,这是一个通过组合来自不同集合的元素来创建有序对(或有序n-元组)集合的操作。其最关键的特性是“有序”,即元素的顺序至关重要。
笛卡尔积是数学中一座极其重要的桥梁,它连接了集合论与几何、代数等多个分支。
| a | b | c | |
|---|---|---|---|
| 1 | (1,a) | (1,b) | (1,c) |
| 2 | (2,a) | (2,b) | (2,c) |
📜 [原文13]
有序对 $(x, y)$ 的操作性质是:1) 对于所有 $x \in X$ 和 $y \in Y$,存在一个有序对 $(x, y) \in X \times Y$,以及 2) 两个有序对 $(x_{1}, y_{1})$ 和 $(x_{2}, y_{2})$ 相等 $\Longleftrightarrow$ 它们具有相同的第一分量和相同的第二分量,即 $\Longleftrightarrow x_{1}=x_{2}$ 且 $y_{1}=y_{2}$;仅仅要求集合 $\left\{x_{1}, y_{1}\right\}$ 和 $\left\{x_{2}, y_{2}\right\}$ 相等是不够的。可以仅使用集合论给出有序对的正式定义。事实上,可以定义 $(x, y)=\{\{x\},\{x, y\}\}$。(换句话说,有序对不必是未定义的术语。)然而,我们并不会真正关心精确的定义是什么,而只关心有序对具有上述性质 1) 和 2)。不过,使用函数,我们可以给出有序 $n$ 元组的仔细定义;我们稍后会描述这一点。
这段备注深入探讨了有序对的本质。它告诉我们,我们真正关心的是有序对“如何工作”(它的性质),而不是它“是什么”(它的构造)。
这是一个定义式,而非计算式。我们来验证它为何能保证有序对的相等性 (x_1, y_1) = (x_2, y_2) \iff x_1=x_2 \land y_1=y_2。
本备注阐明了有序对的两个核心操作性质:存在性和基于分量相等的相等性判据。它进一步揭示,尽管有序对可以被严格地用集合论(如库拉托夫斯基定义)来构造,但在实际应用中,我们只关心其操作性质,而非其底层实现。
本段的目的是加深对“有序”这一概念的理解,并展示现代数学的构造主义思想。它告诉我们,像“顺序”这样看似基本直观的概念,也可以从更底层的“无序”的集合概念中构建出来。这增强了我们对数学体系严谨性和一致性的信心。
📜 [原文14]
(i) 如果 $A \subseteq X$ 且 $B \subseteq Y$,则 $A \times B \subseteq X \times Y$。但是,通常情况下,并不是 $X \times Y$ 的每个子集都具有这种形式(练习 1.1)。
(ii) 根据逻辑,对于每个集合 $X$,$\emptyset \times X=X \times \emptyset=\emptyset$。
(iii) 如果 $X$ 和 $Y$ 是有限集,则 $X \times Y$ 也是有限的,并且
对于 $n$ 个有限集 $X_{1} \times \cdots \times X_{n}$ 的乘积也类似:
特别是,这个公式说明 $\#(\emptyset \times X)=\#(X) \times 0=0$,与 (ii) 一致。
这个备注讨论了笛卡尔积的一些重要性质,包括它的子集、与空集的运算,以及其基数。
(i) 笛卡尔积的子集
(ii) 与空集的乘积
(iii) 笛卡尔积的基数
这些是组合数学中的基本乘法原理。它们不是从更基本的定理推导出来的,而是基于“分步计数”这个基本思想。
本备注阐明了笛卡尔积的三个核心性质:
(i) “矩形”子集 $A \times B$ 是其父集 $X \times Y$ 的子集,但父集的大多数子集都不是这种“矩形”形式。
(ii) 与空集的笛卡尔积恒为空集。
(iii) 有限集的笛卡尔积的基数等于各集合\\基数\\的乘积。
这些性质是使用笛卡尔积的基础。特别是基数的乘法法则是组合数学的基石,用于计算排列组合的总可能性。而对子集形式的探讨,则为后续引入“关系”和“函数”这些更精细的结构(它们都是笛卡尔积的子集)埋下了伏笔。
📜 [原文15]
$X$ 的所有子集的集合也是一个集合,称为 $X$ 的幂集,通常记作 $\mathcal{P}(X)$:
这个定义引入了又一个重要的集合构造方法:幂集 (Power Set)。
这是一个描述法定义。
本段定义了幂集 $\mathcal{P}(X)$,它是一个其元素为原集合 $X$ 所有子集的新集合。
幂集是一个在集合论、逻辑学、计算机科学和拓扑学中都极为重要的构造。
📜 [原文16]
(i) 根据备注 1.1.4 中的传递性,如果 $Y$ 是 $X$ 的子集,则 $\mathcal{P}(Y)$ 是 $\mathcal{P}(X)$ 的子集。
(ii) 注意 $X \in \mathcal{P}(X)$ 且 $\emptyset \in \mathcal{P}(X)$。
(iii) 如果 $X \neq \emptyset$ 且 $x \in X$,则 $\{x\} \in \mathcal{P}(X)$。
(iv) $\mathcal{P}(\emptyset)=\{\emptyset\}$。特别是,$\mathcal{P}(\emptyset) \neq \emptyset$;事实上,$\mathcal{P}(\emptyset)$ 包含唯一的元素 $\emptyset$,因此 $\#(\mathcal{P}(\emptyset))=1$。同样地,$\mathcal{P}(\mathcal{P}(\emptyset))=\mathcal{P}(\{\emptyset\})=\{\emptyset,\{\emptyset\}\}$。特别是,$\#(\mathcal{P}(\mathcal{P}(\emptyset)))=2$。同样地,
因此 $\#(\mathcal{P}(\{\emptyset,\{\emptyset\}\}))=4$。更一般地,我们将看到,如果 $X$ 是一个有限集且 $\#(X)=n$,则 $\#(\mathcal{P}(X))=2^{n}$。
这个例子通过一系列具体情况,帮助我们巩固对幂集的理解,特别是处理空集和嵌套集合时的情况。
(i) 幂集的子集关系
(ii) 两个特殊的元素
(iii) 单元素子集是幂集的元素
(iv) 迭代构造幂集
这个公式是本段的核心示例,展示了对一个包含两个元素的集合求幂集的结果。
本段原文已经给出了非常详尽和典型的关于空集的嵌套示例。我们再举一个普通数值的例子来对比。
此例通过具体情况展示了幂集的性质。它阐明了子集关系如何在幂集层面上传递,强调了 X 和 \emptyset 始终是幂集的元素,并通过对空集进行迭代取幂集操作,深刻揭示了幂集的构造方式及其基数为 $2^n$ 的规律。
这些例子,特别是关于空集的嵌套例子,是检验是否真正理解了集合、子集、元素、幂集这些抽象概念的“试金石”。它们强迫我们摆脱对数字和字母的直观依赖,纯粹依靠定义来进行逻辑推理。这对于培养严谨的数学思维至关重要。
接下来我们定义函数 $f: X \rightarrow Y$。虽然我们可以把函数看作一个“规则”,它将 $X$ 中的每个 $x$ 映射到 $Y$ 中的唯一 $y$,但通过将函数 $f$ 与其在 $X \times Y$ 中的图像(如我们在微积分中被教导不要做的那样)联系起来,可以更容易地精确化这个概念。给定函数 $f: X \rightarrow Y$,我们有其图像 $G_{f} \subseteq X \times Y$,定义为
它具有以下性质:对于所有 $x \in X$,存在唯一一个 $y \in Y$ 使得 $(x, y) \in G_{f}$,即 $y=f(x)$。说存在唯一的 $y \in Y$ 意味着 $f(x)$ 由 $x$ 唯一确定,而说对于每个 $x \in X$ 都存在一个 $(x, y) \in G_{f}$ 则意味着 $f(x)$ 实际上对所有 $x \in X$ 都有定义。这就是所谓的垂直线测试:对于每个 $x \in X$,我们有 $X \times Y$ 的子集 $\{x\} \times Y$。(如果 $X=Y=\mathbb{R}$,这样的子集正是垂直线。)然后我们可以将其反过来作为函数的定义:
这部分开始定义数学中另一个核心概念——函数 (Function)。作者采用了一种非常严谨的、基于集合论的方法来定义函数。
本段为定义函数铺平了道路,其核心策略是:将函数等同于其图像。一个函数的图像是一个特殊的笛卡尔积子集,它必须满足“垂直线测试”:定义域中的每个 $x$ 值,都必须对应图像中有且仅有的一个点。
这种看似绕弯的定义方法,其根本目的是为了严谨性。它将函数这个动态的“过程”或“规则”概念,转化为了一个静态的、良定义的集合对象(即图像),从而将函数完全纳入了集合论的体系中。这使得我们可以用集合论的工具来精确地研究和证明关于函数的各种性质。
📜 [原文17]
函数 $f: X \rightarrow Y$ 是 $X \times Y$ 的一个子集 $G$,使得对于每个 $x \in X$,$(\{x\} \times Y) \cap G$ 恰好包含一个点,必然是 $(x, y)$ 形式的,其中 $y \in Y$。这个唯一的 $y$ 然后记作 $f(x)$。
在上述符号中,我们称 $X$ 为 $f$ 的定义域,称 $Y$ 为 $f$ 的值域。因此,定义域和值域是函数信息的一部分。
我们也将“映射”或“映照”作为函数的同义词;通常映射是某种几何环境中的函数。
这是对函数的正式、严格的定义,完全基于集合论。
本段给出了函数的严格集合论定义:一个函数 $f: X \rightarrow Y$ 就是其图像,即笛卡尔积 $X \times Y$ 的一个满足“垂直线测试”的特殊子集 $G$。同时明确了定义域和值域是函数定义中不可或缺的部分。
这个定义的目的是提供一个无歧义的、坚实的基础,以便在此之上构建整个函数理论。通过将函数对象化为一个集合,所有关于函数的性质(如相等性、复合、反函数等)都可以转化为集合的操作和性质进行证明,从而保证了数学的严谨性。
📜 [原文18]
(i) 注意函数必须在其定义域的所有元素上都有定义;因此,例如,函数 $f(x)=1 / x$ 不能在定义域 $\mathbb{R}$ 上而不对 $f(0)$ 赋值。(这与某些微积分课程中的做法相反,在这些课程中 $f$ 可以不必处处有定义。)
(ii) 两个函数 $f_{1}$ 和 $f_{2}$ 相等当且仅当它们的图像相等,当且仅当,对于所有 $x \in X, f_{1}(x)=f_{2}(x)$。因此,就像集合由其元素指定一样,函数由其值唯一指定。但是我们强调,要使两个函数 $f_{1}$ 和 $f_{2}$ 相等,它们必须具有相同的定义域和值域。
(iii) 如果 $X=\left\{x_{1}, \ldots, x_{n}\right\}$ 是一个有限集,则函数 $f: X \rightarrow Y$ 可以通过一个表格来描述:
| $x_{1}$ | $x_{2}$ | $x_{3}$ | $\ldots$ | $x_{n}$ |
|---|---|---|---|---|
| $f\left(x_{1}\right)$ | $f\left(x_{2}\right)$ | $f\left(x_{3}\right)$ | $\ldots$ | $f\left(x_{n}\right)$ |
这个备注对函数的定义做了一些重要的澄清和补充。
(i) 全域定义 (Total function)
(ii) 函数的相等性 (Equality of Functions)
(iii) 有限集上的函数表示
| :----------------------------------------- | :-- | :-- | :-- | --- |
|---|
此备注强调了函数定义的三个关键方面:
(i) 函数必须在定义域的所有点上有定义(全函数)。
(ii) 两个函数相等的充要条件是它们有相同的定义域、相同的值域,并且对定义域内所有元素给出相同的输出值。
(iii) 有限集上的函数可以用表格方便地表示。
本段旨在消除对函数概念可能存在的模糊认识,为后续的理论建立清晰、无歧义的操作规范。特别是对函数相等性的严格定义,是所有涉及函数的证明和代数运算的基础。例如,当我们说“两个函数的和”时,我们必须先确保它们是“可相加”的(定义域和值域兼容),而相等性则是判断运算结果是否一致的依据。
📜 [原文19]
以下是一些基本的函数示例:
(i) 对于任何集合 $X$,恒等函数 $\operatorname{Id}_{X}: X \rightarrow X$ 满足:对于每个 $x \in X$,$\operatorname{Id}_{X}(x)=x$。因此它在 $X^{2}$ 中的图像是集合
我们可以将其视为 $X^{2}$ 的子集中的“对角线”。(对角线是否满足作为函数图像的测试?) 当 $X$ 在上下文中明确时,我们通常将 $\mathrm{Id}_{X}$ 缩写为 $\mathrm{Id}$。
本节开始列举一些基础但极为重要的函数类型,第一个是恒等函数 (Identity Function)。
| :---------------------- | :-- | :-- | :-- | --- |
|---|
本段定义了恒等函数 Id_X,它将每个元素映射到其自身。它的图像被称为对角线 \Delta_X,由所有形如 (x,x) 的有序对构成。
恒等函数在函数的世界里,扮演着类似于数字“1”在乘法中、数字“0”在加法中的角色。它是一个“单位元 (identity element)”。
| :------------------ | :-------- | :-------- | :-------- | --- |
|---|---|---|---|---|
| b | (b,b) | |||
| c | (c,c) |
📜 [原文20]
(ii) 一个相关例子是包含:如果 $X \subseteq Y$,则 $\Delta_{X}=\{(x, x): x \in X\}$ 是 $X \times Y$ 的子集,它是从 $X$ 到 $Y$ 的函数图像,我们通常将其表示为包含函数 $i_{X}$。
这里介绍了一个与恒等函数密切相关但又有细微区别的函数:包含函数 (Inclusion map) 或包含映射。
本段定义了包含函数 i_X : X -> Y,它存在于当 $X$ 是 $Y$ 的子集时。它将 $X$ 中的每个元素映射到它自身,但将其视为 $Y$ 中的元素。尽管其图像集合与恒等函数 Id_X 相同,但由于值域不同,它们是不同的函数。
包含函数在数学中是一个非常重要的“粘合剂”和“转换器”。它使得我们可以在不同的集合(或更复杂的代数结构,如群、环、空间)之间建立最自然、最直接的联系。
[直觉心- 心灵模型\\:
📜 [原文21]
(iii) 另一个例子,如果 $X, Y \neq \emptyset$,是常数函数:选择 $c \in Y$ 并定义 $f(x)=c$ 对于所有 $x \in X$。(这个函数的图像是什么,为什么它是一个函数?)
这里介绍了第三种基本函数类型:常数函数 (Constant Function)。
本段定义了常数函数,它将定义域中的所有元素都映射到值域中的同一个固定元素 $c$。其图像是一条“水平线”,即 $X \times \{c\}$。
常数函数是函数世界中最简单的非平凡例子(最平凡的是空集上的函数)。它在许多理论构建中作为基础案例或反例出现。
📜 [原文22]
(iv) 当然,所有标准的微积分函数都提供了从 $\mathbb{R}$ 到 $\mathbb{R}$ 的函数示例(或者从开区间的并集到 $\mathbb{R}$,如果不是处处有定义的话)。
这一小段的作用是连接抽象定义与我们已有的知识,告诉我们之前在微积分里学过的那些熟悉的函数,都符合我们现在这个严格的集合论定义。
本段是一个承上启下的例子,它将前面抽象的函数定义与读者在微积分等课程中已经熟悉的具体函数联系起来,确认了那些我们熟知的函数都符合这个更严格的集合论框架。
本段的目的是为了让读者感到安心,确认我们现在学习的这个抽象定义不是什么全新的、奇怪的东西,而是对我们已有知识的提炼和升华。它告诉我们,这个定义是有足够表达力的,能够涵盖数学分析中几乎所有的研究对象。
📜 [原文23]
(v) 另一个例子是笛卡尔积 $X \times X$:给定有序对 $(x_{1}, x_{2})$,我们可以将 $x_{i}$ 视为一个函数,它将值 $x_{1}$ 赋给 1,将 $x_{2}$ 赋给 2。通过这种方式,我们可以将 $X^{2}=X \times X$ 与所有函数 $f:\{1,2\} \rightarrow X$ 的集合等同起来。如果我们要以这种方式定义两个可能不同的集合的笛卡尔积,我们可以将 $X \times Y$ 定义为所有函数 $f:\{1,2\} \rightarrow X \cup Y$ 的集合,使得 $f(1) \in X$ 且 $f(2) \in Y$。同样地,$X^{n}$ 与函数 $f:\{1,2, \ldots, n\} \rightarrow X$ 的集合等同起来,而 $X_{1} \times \cdots \times X_{n}$ 定义为所有函数 $f:\{1,2, \ldots, n\} \rightarrow \bigcup_{i=1}^{n} X_{i}$ 的集合,使得对于每个 $i$ 都有 $f(i) \in X_{i}$。
这是一个非常深刻和抽象的例子。它揭示了笛卡尔积和函数这两个概念之间令人惊讶的内在联系。它提供了一种用函数来重新定义笛卡尔积的视角。
| :--------------------------- | :-- | :-- | --- |
|---|
本段提供了一个看待笛卡尔积的全新视角:一个有序n-元组可以被等同地看作一个定义在索引集 \{1, ..., n\} 上的函数。这个函数将每个索引(位置编号)映射到该位置上的元素。这揭示了笛卡尔积和函数这两个概念本质上的相通性。
这种用函数来定义笛卡尔积的观点,在现代数学中非常重要,因为它具有强大的推广能力。
📜 [原文24]
实数序列 $x_{1}, x_{2}, \ldots$ 与函数 $\mathbb{N} \rightarrow \mathbb{R}$ 是相同的,其中 $\mathbb{N}$ 仍然是自然数集 $\{1,2, \ldots\}$。这里,给定一个函数 $f: \mathbb{N} \rightarrow \mathbb{R}$,我们通过 $x_{i}=f(i)$ 定义一个序列 $x_{1}, x_{2}, \ldots$,反之亦然。更一般地,如果 $X$ 是任何集合,可能是有限的,那么一个值在 $X$ 中的序列 $x_{1}, x_{2}, \ldots$ 与一个函数 $f: \mathbb{N} \rightarrow X$ 是同一回事。
这是上一个例子的直接应用和推广,它明确定义了数学中另一个基本概念——序列 (Sequence)。
本段明确地将无穷序列定义为一个定义域为自然数集 $\mathbb{N}$ 的函数。序列的第 $i$ 项 $x_i$ 就是函数在输入 $i$ 时的输出值 $f(i)$。
这个定义至关重要,因为它用函数这一统一的、严格的工具,定义了序列这个在数学分析、微积分、离散数学等领域无处不在的概念。
📜 [原文25]
(vi) 两个变量的函数与单变量函数 $f: X \times Y \rightarrow Z$ 是同一回事,换句话说,我们对 $X \times Y$ 的元素(即有序对)求 $f$ 的值。传统上,我们写 $f(x, y)$ 而不是 $f((x, y))$ 来表示 $f$ 在 $(x, y)$ 上的值。对于 $n$ 个变量的函数也有类似的约定。
这个例子将我们熟悉的多变量函数纳入了我们当前的单变量函数框架,再次体现了数学追求统一的强大思想。
本段通过将多个输入“打包”成一个有序元组,成功地将多变量函数的概念统一到了单变量函数的框架下。一个 $n$ 元函数被严格地看作是一个定义域为笛卡尔积的单变量函数。
这个例子极大地简化了函数理论。有了这个统一的观点,我们为单变量函数建立的所有理论(如函数相等、复合、反函数等),都可以(或经过适当修改后)应用到多变量函数上,而无需为每一种元数的函数都重新建立一套理论。这体现了数学追求普适性和简洁性的美学原则。
📜 [原文26]
(vii) 给定笛卡尔积 $X \times Y$,我们有第一和第二投影函数:$\pi_{1}: X \times Y \rightarrow X$ 由 $\pi_{1}(x, y)=x$ 定义,同样地 $\pi_{2}: X \times Y \rightarrow Y$ 由 $\pi_{2}(x, y)=y$ 定义。类似地,对于笛卡尔积 $X_{1} \times \cdots \times X_{n}$,我们可以定义到第 $i$ 个因子的投影 $\pi_{i}: X_{1} \times \cdots \times X_{n} \rightarrow X_{i}$ 为:$\pi_{i}\left(x_{1}, \ldots, x_{n}\right)=x_{i}$。还有更复杂的“部分”投影。例如,给定 $i \neq j$,我们可以定义 $\pi_{i, j}: X_{1} \times \cdots \times X_{n} \rightarrow X_{i} \times X_{j}$ 为:$\pi_{i, j}\left(x_{1}, \ldots, x_{n}\right)=\left(x_{i}, x_{j}\right)$。
这里介绍了另一类非常基本且有用的函数——投影函数 (Projection Function)。
本段定义了投影函数 \pi_i,其作用是从一个有序元组中“提取”出第 $i$ 个分量。这是一个从笛卡尔积空间映射到其某个因子空间的基本函数。
投影函数是连接笛卡尔积与其构成部分(因子集合)的桥梁。
📜 [原文27]
(viii) 如果 $X$ 和 $Y$ 是两个集合,那么从 $X$ 到 $Y$ 的所有函数的集合是一个新集合,有时记作 $Y^{X}$:
如果 $X$ 和 $Y$ 是有限的,例如 $\#(X)=n$ 且 $\#(Y)=m$,那么 $Y^{X}$ 也是有限的,且 $\#\left(Y^{X}\right)=m^{n}$。这遵循备注 1.3.2(iii) 中对函数 $f: X \rightarrow Y$ 的表格描述,注意到在这种情况下,对于 $f\left(x_{1}\right)$ 有 $m$ 种选择,对于 $f\left(x_{2}\right)$ 有 $m$ 种选择,...,对于 $f\left(x_{n}\right)$ 有 $m$ 种选择,总共有 $m^{n}$ 种选择。
这个例子引入了一个更高层次的构造:构造一个以函数本身为元素的集合。
| :------ | :-- | :-- | --- |
|---|
| :------ | :-- | :-- | --- |
|---|
| :------ | :-- | :-- | --- |
|---|
| :------ | :-- | :-- | --- |
|---|
本段定义了函数集 $Y^X$,即所有从集合 $X$ 到集合 $Y$ 的函数所构成的集合。对于有限集,其基数遵循指数关系 $\#(Y^X) = (\#(Y))^{\#(X)}$,这也是其记号的由来。
函数集(或称函数空间)是现代数学,特别是泛函分析的核心研究对象。通过将函数本身视为一个集合中的“点”,我们可以在这个函数的集合上定义结构,比如距离(度量)、范数、内积等。这使得我们可以用几何和分析的工具来研究函数,例如讨论“函数的收敛”、“函数的连续性”等。这个概念极大地扩展了数学分析的范围。
📜 [原文28]
给定 $x \in X$,我们通过在 $x$ 处求值得到一个从 $Y^{X}$ 到 $Y$ 的函数 $\mathrm{ev}_{x}$:
因此,当我们上面写 $f(x)$ 时,符号 $f$ 变成了“变量”。还有一个类似的两变量函数 $e: X \times Y^{X} \rightarrow Y$,定义为
注意投影 $\pi_{i}: X^{n} \rightarrow X$ 是求值的一个特例,通过将 $X^{n}$ 视为 $X^{\{1, \ldots, n\}}$ 并在 $i$ 处求值。换句话说,$\pi_{i}$ 与 $\operatorname{ev}_{i}: X^{\{1, \ldots, n\}} \rightarrow X$ 等同。
这一段内容非常抽象,它引入了一个作用于函数集上的函数——求值函数 (Evaluation map)。
本段定义了求值函数 ev_x 和 e。ev_x 是一个从函数集 $Y^X$ 到集合 $Y$ 的函数,其作用是“提取”出输入函数在特定点 $x$ 的值。e 是其更通用的两变量形式。这个概念也揭示了投影函数 \pi_i 本质上就是一种求值函数 ev_i。
求值函数是一个在理论中非常有用的工具。
📜 [原文29]
设 $f: X \rightarrow Y$ 是一个函数。集合
称为 $f$ 的像或 $\operatorname{Im} f$,我们也将其写为 $f(X)$。有时人们将值域称为共域和/或将值域定义为像。在本文中,我们始终区分像和值域。更一般地,如果 $A$ 是 $X$ 的子集,则我们设置
因此 $f(A) \subseteq Y$。通常,函数 $f: X \rightarrow Y$ 的像将是值域的子集,但不一定等于值域。
这一部分定义了与函数输出相关的两个重要概念:像 (Image) 和原像 (Preimage)。本段先聚焦于像。
本段定义了函数的像 f(X),即所有实际输出值的集合。它还推广到定义域子集的像 f(A)。关键是要将其与值域 (Codomain) 区分开,像是值域的一个子集。
像的概念是描述函数行为的核心工具。一个函数的“威力”或“覆盖范围”就是由它的像来衡量的。
[直觉心- 心灵模型\\:
📜 [原文30]
我们还为 $Y$ 的子集 $B$ 定义子集
它是 $X$ 的子集,称为 $B$ 的原像。因此 $f^{-1}(B) \subseteq X$。如果 $B=\{y\}$ 只有一个元素,我们写 $f^{-1}(y)$ 而不是 $f^{-1}(\{y\})$。然而,根据这个定义,$f^{-1}(y)$ 是 $X$ 的子集。例如,$f^{-1}(Y)=X$ 且 $f^{-1}(y) \neq \emptyset$ 当且仅当 $y \in f(X)$,即 $y \in \operatorname{Im} f$。注意:原像 $f^{-1}(B)$ 可以为每个函数 $f: X \rightarrow Y$ 和 $Y$ 的每个子集 $B$ 定义,特别是当 $B=\{y\}$ 时。因此这个符号与我们稍后将定义的逆函数的存在性无关,而是旨在在逆函数存在时造成最大的混淆。因此(与许多数学符号的情况一样),上下文将至关重要。
这部分定义了与像相对偶的概念——原像 (Preimage) 或 逆像 (Inverse Image)。
本段定义了值域子集 $B$ 的原像 f^{-1}(B),即所有能映射到 $B$ 内的定义域元素的集合。它特别强调,原像符号 f^{-1} 并不意味着反函数的存在,且对单点 $y$ 的原像 f^{-1}(y) 也是一个集合。
原像是分析函数的另一个核心工具,它允许我们从“结果”反推“原因”。
📜 [原文31]
从定义可知
就我们的基本函数示例而言,我们有:
(i) 对于 $f=\operatorname{Id}_{X}: X \rightarrow X$,子集 $A \subseteq X$ 的像和原像都是 $A$。
(ii) 如果 $X \subseteq Y$ 且 $i_{X}: X \rightarrow Y$ 是包含,那么 $X$ 的子集 $A$ 的像 $i_{X}(A)$ 就是 $A$,视为 $Y$ 的子集,而 $B \subseteq Y$ 的原像 $i_{X}^{-1}(B)$ 是 $B \cap X$。
(iii) 如果 $f: X \rightarrow Y$ 是常数函数 $f(x)=c$ 对于所有 $x \in X$,那么 $Y$ 的子集 $B$ 的原像 $f^{-1}(B)$ 在 $c \notin B$ 时是 $\emptyset$,在 $c \in B$ 时是 $X$。$X$ 的子集 $A$ 的像 $f(A)$ 在 $A=\emptyset$ 时是 $\emptyset$,在 $A \neq \emptyset$ 时是 $\{c\}$。
这部分探讨了像和原像这两个操作复合起来的性质,并用之前介绍过的基本函数作为例子。
本段阐述了像和原像复合操作的两个基本包含关系:f(f^{-1}(B)) \subseteq B 和 A \subseteq f^{-1}(f(A)),并解释了等号通常不成立的原因。随后,它将像和原像的概念应用到恒等函数、包含函数和常数函数上,给出了它们具体的计算结果。
这些关系和例子是理解像和原像操作如何工作的关键。它们是更高级集合论证的基础。理解为什么等号不成立,能帮助我们更深刻地理解满射和单射的本质。对基本函数的分析,也为我们提供了在更复杂情况下进行推理的“心理模型”。
📜 [原文32]
如果 $Y$ 是另一个集合 $Y^{\prime}$ 的子集,那么函数 $f: X \rightarrow Y$ 定义(以明显的方式)一个从 $X$ 到 $Y^{\prime}$ 的函数。就图像而言,我们把图像 $G_{f} \subseteq X \times Y$ 视为 $X \times Y^{\prime}$ 的子集。从技术上讲,这是两个不同的函数,尽管我们偶尔会(不正确地)模糊这种区别。此外,给定一个函数 $f: X \rightarrow Y$,我们总是可以将其替换为一个从 $X$ 到 $f(X) \subseteq Y$ 的函数。更一般地,如果 $f(X) \subseteq B \subseteq Y$,那么 $G_{f} \subseteq X \times B$ 并定义一个新函数 $X \rightarrow B$。
这个备注讨论了如何通过改变函数的值域 (Codomain) 来“改造”一个函数。
本备注的核心思想是:一个函数的对应规则(由其图像决定)和它的值域在技术上是分离的。我们可以通过扩大或缩小值域(只要新值域仍包含像)来“改造”一个函数,得到一个技术上不同但行为相似的新函数。特别地,任何函数都可以通过将其值域缩小到其像,而变成一个满射函数。
这个看似学究气的区分,是理解函数性质(特别是满射)的关键。它给予了我们灵活性。当我们需要一个满射函数时,我们可以通过这种“缩小值域”的操作来方便地获得一个。这种思想在抽象代数的同构定理等高级理论中非常重要,它允许我们在不同的目标空间中“重塑”函数,以揭示更深刻的结构。
📜 [原文33]
如果 $f: X \rightarrow Y$ 是一个函数且 $A \subseteq X$,那么我们定义 $f$ 到 $A$ 的限制 $f \mid A$ 为函数 $f \mid A: A \rightarrow Y$,由 $(A \times Y) \cap G_{f}$ 定义,其中 $G_{f}$ 是 $f$ 的图像。换句话说,对于所有 $a \in A$,$(f \mid A)(a)=f(a)$,且 $f \mid A$ 的定义域恰好是 $A$。如果 $f(A) \subseteq B$,则存在诱导函数 $g: A \rightarrow B$,通过将备注 1.4.2 的过程应用于 $f \mid A$ 获得,如果 $B \neq Y$,则在技术上与 $f \mid A$ 不同。
这个定义介绍了与“改造值域”相对的操作:“改造定义域”,即限制 (Restriction)。
本段定义了函数的限制操作 f|A,即通过缩小定义域来创建一个新函数。它还结合之前缩小值域的操作,定义了更复杂的诱导函数,这允许我们同时“裁剪”定义域和值域。
限制操作是数学中进行“局部研究”的核心工具。很多时候,一个函数在整个定义域上行为很复杂,但在某个局部(一个子集)上可能具有非常好的性质。通过限制,我们可以把注意力集中在这个“表现良好”的局部,进行分析或求解,这在微积分(局部极值)、微分几何(局部坐标卡)等领域中无处不在。
📜 [原文34]
函数 $f: X \rightarrow Y$ 是满射或映上的,如果 $f(X)=Y$,换句话说,如果 $f$ 的像是 $Y$。
函数 $f: X \rightarrow Y$ 是单射或一对一的,如果对于所有 $x_{1}, x_{2} \in X, f\left(x_{1}\right)=f\left(x_{2}\right)$ 当且仅当 $x_{1}=x_{2}$。等价地,对于所有 $y \in Y$,集合 $f^{-1}(y)$ 最多只有一个元素。因此,如果对于所有 $y \in Y$,方程 $f(x)=y$ 最多只有一个解,或者换句话说,如果存在解,则它是唯一的,那么 $f$ 是单射的。
相比之下,如果对于所有 $y \in Y$,方程 $f(x)=y$ 有解(不一定是唯一的),那么 $f$ 是满射的。
函数 $f: X \rightarrow Y$ 既是一对一又是映上的,则称为双射或一一对应。等价地,$f$ 是双射 $\Longleftrightarrow$ 对于所有 $y \in Y$,存在唯一的 $x \in X$ 使得 $f(x)=y$。
这一定义引入了对函数进行分类的三个最基本的属性:满射 (Surjection), 单射 (Injection), 和 双射 (Bijection)。这些属性描述了函数的输入和输出之间“连接”方式的特征。
令 $X=\{1,2,3\}, Y=\{a,b\}$。
本段定义了函数的三个核心分类属性:
这些分类是函数理论的基石,几乎所有关于函数的高级理论都建立在这些概念之上。
📜 [原文35]
(i) 取 $X=\mathbb{R}$,函数 $f(x)=x^{2}$ 既不是单射也不是满射。(什么时候 $x_{1}^{2}=x_{2}^{2}$?$f$ 的像是什么?)然而,相应的函数定义了一个单射 $[0, \infty) \rightarrow \mathbb{R}$,一个满射 $\mathbb{R} \rightarrow[0, \infty)$,以及一个双射 $[0, \infty) \rightarrow[0, \infty)$。
(ii) 函数 $f(x)=e^{x}$ 是单射但不是满射。($f$ 的像是什么?)函数 $f(x)=x^{3}+1$ 是一个双射。
(iii) 对于每个集合 $X$,恒等函数 $\operatorname{Id}_{X}: X \rightarrow X$ 始终是一个双射。
(iv) 给定函数 $f: X \rightarrow Y$,备注 1.4.2 中描述的相应函数 $X \rightarrow f(X)$ 自动是满射的。换句话说,我们可以通过缩小值域将每个函数转换为一个(可能不同的)满射函数。
这个例子通过我们熟悉的微积分函数来具体展示单射、满射和双射的性质,并强调了这些性质是如何依赖于定义域和值域的。
(i) $f(x)=x^2$ 的变身
(ii) 其他例子
(iii) 恒等函数
(iv) 将任意函数变为满射
这个例子通过一系列具体函数,生动地展示了如何判断单射、满射和双射,并揭示了通过“裁剪”定义域或值域来改变函数性质的强大技术。任何函数都可以通过缩小其值域到其像而被“转化”为一个满射函数。
本例旨在将抽象的定义与读者的既有经验联系起来,加深对概念的理解。它强调了函数性质的“相对性”——一个函数的属性不是孤立的,而是由其规则、定义域、值域三者共同决定的。这种“改造函数”的思想是解决问题的重要策略,例如,在需要反函数时,我们常常需要先通过限制操作,从一个非双射的函数中“雕刻”出一个双射的部分。
📜 [原文36]
单射或满射的性质也可以通过“水平线”来描述,换句话说,通过形式为 $X \times\{y\}$ 的 $X \times Y$ 的子集(当 $X=Y=\mathbb{R}$ 时,它们恰好是水平线)。函数 $f: X \rightarrow Y$ 是单射 $\Longleftrightarrow$ 对于每个 $y \in Y$,图像 $G_{f}$ 与 $X \times\{y\}$ 的交集,即 $G_{f} \cap(X \times\{y\})$,最多有一个点。函数 $f$ 是满射 $\Longleftrightarrow$ 对于每个 $y \in Y$,图像 $G_{f}$ 与 $X \times\{y\}$ 的交集,即 $G_{f} \cap(X \times\{y\})$,至少有一个点。因此,$f$ 是双射 $\Longrightarrow$ 对于每个 $y \in Y$,图像 $G_{f}$ 与 $X \times\{y\}$ 的交集,即 $G_{f} \cap(X \times\{y\})$,恰好有一个点。这可以解释如下:对于 $X \times Y$ 的每个子集 $A$,我们通过以下方式得到 $Y \times X$ 的一个新子集 ${ }^{t} A$:
这是“关于对角线反射”的抽象类比。上述说法是 $f$ 是双射 $\Longleftrightarrow$ 当 ${ }^{t} G_{f}$ 被视为 $Y \times X$ 的子集时,它满足“垂直线测试”。因此:
这部分将上一节例子中提到的“水平线测试”从几何直观提升到了严格的集合论描述,并由此引出了反函数存在的根本条件。
这是一个定义式。它定义了“转置”操作,将一个由 (x,y) 组成的集合 A 变换成一个由 (y,x) 组成的集合 ${}^t A。
本段将单射、满射、双射的性质与“水平线测试”的集合论版本联系起来。更重要的是,它通过引入图像的“转置”操作,从根本上揭示了双射与反函数存在性之间的深刻联系:一个函数是双射,等价于其“翻转后的图像”满足函数的定义。
本段的目的是为下一节的命题 1.5.3(即双射等价于反函数存在)提供一个坚实的、基于图像和集合论的证明思路。它将反函数这个概念从一个纯粹的代数操作(寻找一个能“抵消”原函数的函数),转化为一个几何/集合论的操作(对图像进行“关于对角线反射”)。这种几何化的观点非常强大和直观。
📜 [原文37]
函数 $f: X \rightarrow Y$ 是双射 $\Longleftrightarrow$ 子集 ${ }^{t} G_{f} \subseteq Y \times X$ 是从 $Y$ 到 $X$ 的函数图像。这个函数记作 $f^{-1}$。
$f^{-1}$ 的定义性质如下:
这个命题是上一段讨论的正式总结,是函数理论中的一个基石定理。
这个公式是使用反函数时最核心的操作法则。它允许我们在一个等式两边同时“作用”一个函数或其反函数(类似于对方程两边同时加减乘除)。
该命题给出了函数可逆的充要条件:一个函数是双射。它将反函数 $f^{-1}$ 严格地定义为由“翻转后”的图像 ${}^t G_f 所代表的函数,并给出了反函数最核心的运算性质 y=f(x) \iff x=f^{-1}(y)。
这个命题是连接函数属性和函数运算的关键桥梁。它为我们提供了一个明确的判据来判断一个函数是否有反函数,并为我们找到了计算和使用反函数的理论依据。反函数的概念在数学中极为重要,它代表了“逆运算”或“解方程”的过程。没有反函数,我们就无法从结果反推原因。
📜 [原文38]
如果 $X$ 和 $Y$ 是有限集,并且 $f: X \rightarrow Y$ 是一个双射,那么 $\#(X)=\#(Y)$。事实上,我们可以通过以下方式定义一个有限集 $X$:$X$ 是有限的 $\Longleftrightarrow$ 对于某个自然数 $n$,存在一个从集合 $\{1, \ldots, n\}$ 到 $X$ 的双射,在这种情况下 $\#(X)=n$。(因此,根据定义,一个无限集 $X$ 是指对于每个自然数 $n$,都不存在从 $\{1, \ldots, n\}$ 到 $X$ 的双射。)
更一般地,如果 $X$ 和 $Y$ 是有限集,则
(i) 存在双射 $f: X \rightarrow Y \Longleftrightarrow \#(X)=\#(Y)$。
(ii) 存在单射 $f: X \rightarrow Y \Longleftrightarrow \#(X) \leq \#(Y)$。
(iii) 存在满射 $g: X \rightarrow Y \Longleftrightarrow \#(X) \geq \#(Y)$。
(iv) 如果 $\#(X)=\#(Y)$ 且 $g: X \rightarrow Y$ 是一个函数,那么 $g$ 是单射 $\Longleftrightarrow g$ 是满射 $\Longleftrightarrow g$ 是双射。
上述三条事实中的任何一条都称为鸽巢原理。
这个备注探讨了单射、满射、双射在有限集上的表现,这与我们的直觉高度吻合,并引出了著名的鸽巢原理 (Pigeonhole Principle)。
本备注建立了在有限集背景下,函数的单射/满射/双射性质与集合基数之间的紧密联系。核心结论是鸽巢原理的各种形式,以及在两个等大有限集之间,单射、满射和双射是等价的。
📜 [原文39]
很容易得出,如果 $X$ 是有限的且 $A$ 是 $X$ 的真子集,那么 $\#(A)< \#(X)$ 且不存在从 $A$ 到 $X$ 的双射。结果表明,无限集可以通过相反的性质来表征:$X$ 是无限的 $\Longleftrightarrow$ 存在 $X$ 的真子集 $A$ 和一个从 $A$ 到 $X$ 的双射。
尽管我们不会使用无限基数的语言,但如果存在从 $\mathbb{N}$ 到 $X$ 的双射,则集合 $X$ 是可数的。例如,$\mathbb{N}, \mathbb{Z}$ 和 $\mathbb{Q}$ 都是可数的。如果不存在从 $\mathbb{N}$ 到 $X$ 的双射,则无限集 $X$ 是不可数的。例如,康托的一个著名结果是 $\mathbb{R}$ 是不可数的。此外,幂集 $\mathcal{P}(\mathbb{N})$ 是不可数的(事实上,存在从 $\mathcal{P}(\mathbb{N})$ 到 $\mathbb{R}$ 的双射)。
这个备注进一步深入探讨了有限集和无限集的本质区别,并引入了“可数”与“不可数”这一对描述无穷的重要概念。
本备注通过“部分与整体”的关系,深刻地揭示了有限与无限的本质区别。它引入了戴德金无限的定义,并进一步将无限集划分为可数和不可数两类,列举了各自的典型例子,如 $\mathbb{N}, \mathbb{Z}, \mathbb{Q}$ 是可数的,而 $\mathbb{R}$ 是不可数的。
📜 [原文40]
给定函数 $f: X \rightarrow Y$ 和 $g: Y \rightarrow Z$,定义复合函数 $g \circ f: X \rightarrow Z$ 为
对于所有 $x \in X$。当然,我们也可以通过稍微复杂的规则将 $g \circ f$ 定义为一个图像
其中 $\pi_{1,3}$ 是例 1.3.3 (vii) 中定义的到 $X \times Z$ 的投影。
这个定义引入了组合函数的一种基本方式:函数复合 (Function Composition)。
这是复合函数的操作性定义。g \circ f 是新函数的名字,它作用于 $x$ 的结果,是通过先计算 $f(x)$,再将结果作为输入计算 $g$ 的值得到的。
本段定义了函数复合 g \circ f,它代表了将函数 $f$ 和 $g$ 按顺序串联起来形成的一个新函数。其核心规则是 (g \circ f)(x) = g(f(x)),运算顺序与书写顺序相反。函数复合通常不满足交换律。
📜 [原文41]
(i) 给定 $f: X \rightarrow Y, \operatorname{Id}_{Y} \circ f=f \circ \operatorname{Id}_{X}=f$。因此,恒等函数在复合下表现得非常像恒等元,只要我们小心相关恒等函数的定义域。
(ii) 如果 $f: X \rightarrow Y$ 是一个函数且 $A \subseteq X$,则 $f \circ i_{A}=f \mid A$,其中 $i_{A}: A \rightarrow X$ 是例 1.3.3(ii) 中定义的包含函数。同样地,如果 $Y \subseteq Y^{\prime}$ 且 $i_{Y}: Y \rightarrow Y^{\prime}$ 是包含,那么 $i_{Y} \circ f$ 就是我们在备注 1.4.2 中描述的函数。
这个例子展示了恒等函数和包含函数在复合运算中的作用。
(i) 恒等函数是复合运算的单位元
(ii) 包含函数与限制/扩展的关系
本例揭示了复合运算如何与其他基本函数(恒等、包含)和基本操作(限制、扩展值域)联系起来:
(i) 恒等函数是复合运算的单位元。
(ii) 与定义域的包含函数复合,等价于对函数进行限制。与值域的包含函数复合,等价于扩大函数的值域。
📜 [原文42]
函数复合有一个重要的性质,即它在有定义时是结合的:
命题 1.6.3. 假设给定函数 $f: X \rightarrow Y, g: Y \rightarrow Z$ 和 $h: Z \rightarrow W$。那么
证明。对于所有 $x \in X$,
因此对于所有 $x \in X$,$(h \circ(g \circ f))(x)=((h \circ g) \circ f)(x)$,所以 $h \circ(g \circ f)=(h \circ g) \circ f$。
这个命题指出了函数复合最重要的代数性质之一:结合律 (Associativity)。
该命题及其证明确立了函数复合运算满足结合律。这意味着在进行一长串函数复合时,我们可以省略括号,写成如 $h \circ g \circ f$ 的形式,其含义是明确的。
📜 [原文43]
通常函数复合不是交换的。例如,给定 $f: X \rightarrow Y$,我们只能在 $X=Z$ 时以两种顺序与 $g: Y \rightarrow Z$ 进行复合。在这种情况下,$g \circ f: X \rightarrow X$ 和 $f \circ g: Y \rightarrow Y$,我们只能在 $X=Y$ 时比较它们。最后,非常简单的例子表明,即使 $Y=X$,如果我们随机选择两个函数 $f: X \rightarrow X$ 和 $g: X \rightarrow X$,那么 $g \circ f \neq f \circ g$(只要 $X$ 有多于一个元素)。换句话说,两个随机函数的复合(其定义域和值域都等于一个固定集合 $X$)将取决于顺序(例如,取 $X=\mathbb{R}, f(x)=e^{x}, g(x)=x^{2}+1$,并检查 $g \circ f \neq f \circ g$)。
这部分内容强调了函数复合的一个关键特性:不满足交换律 (Not Commutative)。
本段通过层层分析和具体反例,有力地证明了函数复合运算在绝大多数情况下都不满足交换律。改变复合的顺序会从根本上改变运算的含义和结果。
📜 [原文44]
我们已经看到恒等函数的作用非常类似于实数加法或乘法的恒等元。我们也可以询问逆函数:
设 $f: X \rightarrow Y$ 是一个函数。逆函数 $g: Y \rightarrow X$ 是一个函数 $g$,使得 $g \circ f=\operatorname{Id}_{X}$ 且 $f \circ g=\operatorname{Id}_{Y}$。
这个定义正式引入了逆函数 (Inverse Function) 的概念,它完全是基于复合运算和恒等函数来定义的。
本段从代数结构的角度,通过与乘法求逆类比,定义了函数的逆函数。一个函数 g 是 f 的逆函数,当且仅当它们在两个方向上的复合结果都分别是相应集合上的恒等函数。
📜 [原文45]
对于恒等函数 $\operatorname{Id}_{X}: X \rightarrow X$,由于 $\operatorname{Id}_{X} \circ \operatorname{Id}_{X}=\operatorname{Id}_{X}$,$\operatorname{Id}_{X}$ 是自身的逆函数。
这个例子非常简单,它说明了恒等函数的逆函数就是它自己。
恒等函数是自身的逆函数。这再次加强了它与数字 1(1的倒数是 1)或数字 0(0的相反数是 0)的类比。
📜 [原文46]
正如我们很快将展示的,如果逆函数存在,它就是唯一的,并且实际上就是我们记作 $f^{-1}$ 的函数。这不应与可以为任何函数定义的原像混淆,也不应与 $1 / f$ 混淆,后者可以为从不为零的实值函数定义。请注意,如果 $f: X \rightarrow Y$ 是一个双射,其逆函数为 $f^{-1}$,那么 $f^{-1}(y)$ 可能表示 $f^{-1}$ 在 $y$ 上的值,它是一个 $X$ 的元素,或者表示 $y$ 的原像,它是子集 $f^{-1}(\{(y)\}) \subseteq X$,因此等于单元素子集 $\left\{f^{-1}(y)\right\}$。
这段话再次强烈地提醒读者注意符号 f^{-1} 的歧义性,并预告了逆函数的唯一性。
本段强调了即将证明的逆函数的唯一性,并花费大量篇幅剖析了 f^{-1} 这一符号可能产生的三种不同含义(逆函数、原像、倒数),澄清了在双射情况下逆函数求值和原像操作之间的精确关系。
📜 [原文47]
类似地,对于 $f$ 的左逆是一个函数 $g: Y \rightarrow X$ 使得 $g \circ f=\operatorname{Id}_{X}$,而对于 $f$ 的右逆是一个函数 $g: Y \rightarrow X$ 使得 $f \circ g=\operatorname{Id}_{Y}$。一个函数可能有一个右逆但没有左逆,反之亦然。然而,如果一个函数同时具有右逆和左逆,它们是相等的:
假设 $f: X \rightarrow Y$ 是一个函数,并且 $g: Y \rightarrow X$ 和 $h: Y \rightarrow X$ 是函数,使得 $g \circ f=\operatorname{Id}_{X}$ 且 $f \circ h=\operatorname{Id}_{Y}$。那么 $g=h$,因此 $g=h$ 是 $f$ 的逆函数。
证明。考虑 $g \circ f \circ h$。由于函数复合是结合的,这等于
但以另一种方式结合则表明它也等于
因此 $g=h$。
这个命题极其精妙和重要。它揭示了左逆和右逆的关系,并直接证明了逆函数的唯一性。
该命题通过一个极为优雅的结合律应用,证明了如果一个函数同时有左逆和右逆,那么它们必然相等。这直接导致了逆函数(如果存在)的唯一性。
📜 [原文48]
如果 $g_{1}$ 和 $g_{2}$ 是 $f$ 的两个逆函数,那么 $g_{1}=g_{2}$。换句话说,逆函数如果存在,则是唯一的。
证明。由于逆函数既是左逆又是右逆,我们可以应用前面的命题,例如将 $g_{1}$ 视为右逆,将 $g_{2}$ 视为左逆,从而得出 $g_{1}=g_{2}$。
这个推论 (Corollary) 是上一个命题的直接结果。
该推论明确指出了逆函数的唯一性,其证明是命题1.6.6的直接应用。
📜 [原文49]
注意 $g$ 是 $f$ 的左逆 $\Longleftrightarrow f$ 是 $g$ 的右逆,对于右逆也类似。特别是,如果 $f$ 有逆函数 $f^{-1}$,那么 $f$ 是 $f^{-1}$ 的右逆和左逆,因此是 $f^{-1}$ 的逆函数。我们可以这样表达:
假设 $f: X \rightarrow Y$ 有逆函数 $f^{-1}: Y \rightarrow X$。那么 $f^{-1}$ 也有一个逆函数,并且事实上它必然等于 $f$。换句话说,
这个命题讨论了“求逆”这个操作的对合性,即“逆的逆等于自身”。
该命题指出,“求逆”是一个对称操作。如果 g 是 f 的逆函数,那么 f 也必然是 g 的逆函数。这可以简洁地表示为 (f^{-1})^{-1} = f。
📜 [原文50]
左逆和右逆与单射和满射之间的关系由以下内容给出:
设 $f: X \rightarrow Y$ 是一个函数。
(i) 如果 $f$ 有左逆,则 $f$ 是单射。
(ii) 如果 $f$ 有右逆,则 $f$ 是满射。
(iii) $f$ 有逆函数当且仅当 $f$ 是双射,在这种情况下,其逆函数是与 ${ }^{t} G_{f}$ 相关联的函数。
证明。(i), (ii):作为练习(练习 1.7)。事实上,(ii) 是一个当且仅当语句,而 (i) 是一个当且仅当语句,只要 $X \neq \emptyset$。
(iii) (概要。)使用 $f: X \rightarrow Y$ 是双射 $\Longleftrightarrow{ }^{t} G_{f} \subseteq Y \times X$ 是函数 $g: Y \rightarrow X$ 的图像这一事实,并检查,必然有 $g \circ f=\operatorname{Id}_{X}$ 且 $f \circ g=\operatorname{Id}_{Y}$。反之,如果 $f^{-1}: Y \rightarrow X$ 是逆函数,则很容易看出 $G_{f^{-1}}={ }^{t} G_{f}$,因此 $f$ 是双射。
这个命题是连接函数的代数性质(可逆性)和其映射性质(单射/满射/双射)的核心桥梁。
(i) 左逆 $\implies$ 单射
(ii) 右逆 $\implies$ 满射
(iii) 逆函数 $\iff$ 双射
该命题建立了可逆性与映射性质之间的精确对应关系:
📜 [原文51]
两个单射的复合是单射,两个满射的复合是满射(练习 1.5)。因此,两个双射的复合是双射。然而,鉴于上述备注,通过描述复合函数的逆函数来证明这个最后的陈述会更好,这还有一个优点,即给出了逆函数的公式。注意公式中的顺序颠倒,这是基本事实。
假设 $f: X \rightarrow Y$ 有逆函数 $f^{-1}: Y \rightarrow X$,并且 $g: Y \rightarrow Z$ 有逆函数 $g^{-1}: Z \rightarrow Y$。那么 $g \circ f$ 有一个逆函数,并且它等于 $f^{-1} \circ g^{-1}$。
证明。我们必须检查两个等式
由于它们是相似的,我们只检查第一个:通过结合律,
这个命题给出了复合函数的逆函数公式,它揭示了一个重要的“穿袜子-脱袜子”原理。
该命题给出了复合函数求逆的公式:(g \circ f)^{-1} = f^{-1} \circ g^{-1},即逆函数的复合顺序与原函数的复合顺序相反。
📜 [原文52]
如果 $f: X \rightarrow Y$ 和 $g: Y \rightarrow Z$ 是双射,那么 $g \circ f$ 也是双射。
这个推论是上一个命题的直接结果。
双射的复合是双射。
📜 [原文53]
当然,如上所述,可以直接从定义证明推论 1.6.11。
双射表达了两个集合具有相同数量元素的思想。我们已经讨论过有限集的情况。对于无限集,这可以用来定义两个无限集具有相同数量元素的含义(康托)。但这样的双射可能非常不明显。例如,可以证明存在从 $\mathbb{R}$ 到 $\mathbb{R}^{2}$ 的双射,或者实际上到任何 $n>0$ 的 $\mathbb{R}^{n}$ 的双射,但这样的双射不具有几何性质,也不能以任何显式方式写出来。
这部分阐述了双射的核心意义——作为比较集合大小的工具,并指出了它在无限集上的一些反直觉的应用。
本段指出了双射作为衡量集合大小工具的核心地位,并用 $\mathbb{R}$ 和 $\mathbb{R}^2$ 之间存在双射这一惊人事实,说明了在处理无限集时,纯粹的集合论观点可能与我们的几何直觉相悖。
📜 [原文54]
另一方面,特别是在代数中,我们经常寻找“好的”双射,这可能告诉我们两个集合即使在技术上不同,也可能本质上是相同的。例如,如果 $X \neq Y$,集合 $X \times Y$ 和 $Y \times X$ 是不同的集合,但存在一个自然函数 $F: X \times Y \rightarrow Y \times X$,由 $F(x, y)=(y, x)$ 定义。这个函数是一个双射:如果 $F\left(x_{1}, y_{1}\right)=F\left(x_{2}, y_{2}\right)$,那么根据定义 $\left(y_{1}, x_{1}\right)=\left(y_{2}, x_{2}\right)$ 作为 $Y \times X$ 中的有序对。因此,根据有序对相等的运算性质,$y_{1}=y_{2}$ 且 $x_{1}=x_{2}$,从而 $\left(x_{1}, y_{1}\right)=\left(x_{2}, y_{2}\right)$。因此 $F$ 是单射。为了看出它是满射,设 $(y, x)$ 是 $Y \times X$ 的任意元素。那么 $(y, x)=F(x, y)$。因此 $F$ 是满射,从而是一个双射。在不直接验证 $F$ 既是单射又是满射的情况下,很容易找到一个逆函数 $G: Y \times X \rightarrow X \times Y$。(这个逆函数是什么?)同样地,存在从 $X_{1} \times\left(X_{2} \times X_{3}\right)$ 到 $\left(X_{1} \times X_{2}\right) \times X_{3}$ 的双射,以及从这两个集合中的任何一个到 $X_{1} \times X_{2} \times X_{3}$ 的双射。事实上,这些双射非常明显,以至于我们不总是显式地写出它们。
这部分将关注点从纯粹的集合论转向代数,强调了寻找“自然的”或“保持结构的”双射的重要性,这种双射被称为同构 (Isomorphism)。
本段强调了在代数语境下,我们更关心那些能保持结构的“自然”双射(即同构)。通过笛卡尔积的“交换律”和“结合律”的例子,说明了两个技术上不同的集合可以通过一个自然的双射被视为“本质上相同”。
📜 [原文55]
再举一个例子,我们可以将幂集 $\mathcal{P}(X)$ 与所有从 $X$ 到 $\{0,1\}$ 的函数集等同起来,即与 $\{0,1\}^{X}$ 等同,如下所示。
设 $X$ 是一个集合,设 $A \subseteq X$,即 $A \in \mathcal{P}(X)$。定义特征函数 $\chi_{A}: X \rightarrow\{0,1\}$ 为:
那么 $\chi_{A} \in\{0,1\}^{X}$。
这个定义引入了一个极其重要的函数——特征函数 (Characteristic Function),它在集合和函数之间建立了一座完美的桥梁。
这是一个分段函数的定义。
本段定义了特征函数 \chi_A,它将一个集合 $X$ 的子集 $A$ 与一个从 $X$ 到 {0,1} 的函数唯一地联系起来。这个函数可以被看作是该子集的“数字指纹”。
📜 [原文56]
因此,给定 $\mathcal{P}(X)$ 的一个元素 $A$,我们定义了一个函数 $\chi_{A}: X \rightarrow\{0,1\}$,即 $\{0,1\}^{X}$ 的一个元素。反之,如果 $f \in\{0,1\}^{X}$,即 $f$ 是一个从 $X$ 到 $\{0,1\}$ 的函数,定义 $S_{f}=f^{-1}(1)= \{x \in X: f(x)=1\}$。更正式地,我们通过公式
定义了一个函数 $F: \mathcal{P}(X) \rightarrow\{0,1\}^{X}$。
函数 $G:\{0,1\}^{X} \rightarrow \mathcal{P}(X)$ 定义为
是 $F$ 的逆函数,可以通过验证以下两个陈述来检查:
这些陈述通过展开定义来检查(参见练习 1.9)。
这部分内容完成了在幂集和函数集之间建立双射的证明。
本段通过构造一对互逆的映射 F 和 G,严格地证明了集合 $X$ 的幂集 \mathcal{P}(X) 与从 $X$ 到 {0,1} 的函数集 {0,1}^X 是双射等价的。F 将一个子集 A 映射到其特征函数 \chi_A,而 G 将一个函数 f 映射到其值为1的原像集合。
📜 [原文57]
那么根据备注 1.5.4,如果 $X$ 是一个有限集且 $\#(X)=n$,则
上述例子说明了数学中的一个普遍模式 ... (略)
这是前面证明的一个直接推论,它解释了为什么幂集的基数是 $2^n$。
本段利用幂集与特征函数集之间的双射关系,以及函数集的基数公式,严格地推导出了一个n元有限集的幂集的基数为 $2^n$。
设 $X$ 是一个集合。我们定义 $S_{X}$,即 $X$ 的置换集,为所有双射 $f: X \rightarrow X$ 的集合。因此 $S_{X} \subseteq X^{X}$,即所有从 $X$ 到 $X$ 的函数集。
如果 $X$ 是一个集合且 $S_{X}$ 如上定义,则
(i) 对于所有 $f, g \in S_{X}$,$g \circ f \in S_{X}$。
(ii) $\operatorname{Id}_{X} \in S_{X}$。
(iii) 如果 $f \in S_{X}$,则 $f^{-1} \in S_{X}$。
换句话说,$S_{X}$ 在复合下是封闭的,包含 $X$ 上的恒等函数,并且 $S_{X}$ 的每个元素都有一个逆元素,它也在 $S_{X}$ 中。
这部分内容引入了一个在抽象代数中极端重要的核心概念——置换群 (Permutation Group) 或 对称群 (Symmetric Group)。
本段定义了集合 $X$ 的置换集 S_X,即所有从 $X$ 到自身的双射的集合。并证明了 S_X 在函数复合运算下满足封闭性、存在单位元和存在逆元这三个性质,这使得 (S_X, \circ) 构成一个群。
📜 [原文58]
对于一个有限集 $X$,其 $\#(X)=n$,我们通常将 $X$ 取为具有 $n$ 个元素的标准有限集,即 $\{1, \ldots, n\}$,并用 $S_{n}$ 缩写 $S_{\{1, \ldots, n\}}$。通过计数,$\#\left(S_{n}\right)=n!$,因为要定义一个双射 $f:\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$,对于 $f(1)$ 有 $n$ 种可能的选择,但对于 $f(2)$ 只有 $n-1$ 种选择,因为值 $f(1)$ 被排除:由于 $f$ 是单射,我们不能有 $f(1)=f(2)$。继续下去,对于 $f(3)$ 有恰好 $n-2$ 种选择,...,对于 $f(n-1)$ 有 2 种选择,对于 $f(n)$ 只有一种选择。这表明单射 $\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$ 的总数是
但根据备注 1.5.4,单射 $\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$ 与双射 $\{1, \ldots, n\} \rightarrow\{1, \ldots, n\}$ 是同一回事。因此 $\#\left(S_{n}\right)=n!$。当然,类似的论证表明,对于任何具有 $\#(X)=n$ 的有限集 $X$,$\#\left(S_{X}\right)=n!$。
集合 $S_{n}$ 是 $n$ 个字母上的对称群或度数为 $n$ 的对称群。
这部分专注于有限集上的置换集,并计算其大小。
本段确定了作用于n元有限集上的置换集 S_n 的大小为 n!,并通过定义1.6.15正式将其命名为对称群。
[[END_OF_RESPONSE]]所有解释内容已全部输出完毕。